“十大发展突破”系列之基于大模型的汽车人工智能技术
2024-10-30 15:04:50

 

10月17日,世界智能网联汽车大会盛大开幕,中国工程院副院长、中国工程院院士钟志华代表大会正式发布了《智能网联汽车全球十大发展突破》。中国汽车工程学会受大会委托,组织全球两百余位专家联合研究,经全球征集提名、专家遴选推荐、大会审议决定等环节,最终从过去5-10年的代表性成果中评选得出十大发展突破。

作为一家以科技赋能汽车产业人才的新旧动能转换、赋能智能网联人才终身成长和精准就业的高新技术企业,易飒科技长期关注智能网联汽车领域前沿技术,特此推出“十大发展突破”系列科普文章,以飨读者,此篇为第一篇。

 

 

依托模仿学习和强化学习的驾驶大模型训练方法,拓宽了车辆ODD范围,促进了智能网联汽车快速落地。

目前实现端到端驾驶的方法主要有两种:通过模仿学习,训练其模仿人类驾驶员的驾驶行为和决策过程;通过强化学习,让算法通过与环境的交互来探索和改进驾驶模型。

 

在自动驾驶领域中,模仿学习通过学习人类驾驶员的操作,比如加速、减速、转向、换道等的决策过程,直接从专家的示范中学习。这种方式的性能高度依赖于人类驾驶员专家数据示例的数量和质量,但不需要进行反复试错,可以在没有明确奖励信号或者标记数据的情况下学会驾驶。

 

条件模仿学习训练框架COiLTRAiNE系统概览图。

图源Github,作者Felipe Codevilla

 

而强化学习则通过探索尝试不同的行为,根据结果获得奖励或惩罚来优化决策过程,实现自主进化。这种方式的模型需要进行大量试错来迭代训练,但能够适应复杂和稀有的交通环境,在实时动态的环境中进行快速决策。

 

强化学习框架示意图。

图源CSDN,作者智能科技前沿

 

这两种方法各有优劣,二者结合,或可探索出具有更高适应性、鲁棒性和数据效率,更低成本的方式。

 

车辆ODD是Operational Design Domain的缩写,意为运行设计域。2021年SAE发布的第四版J3016《驾驶自动化分级》中,将其定义为:特定驾驶自动化系统或其功能专门设计的运行条件,包括但不限于环境、地理和时间限制,和/或某些交通或道路特征的存在或缺失。

 

NHTSA(美国运输部国家公路交通安全管理局) ODD分类框架。

图源《自动驾驶系统设计运行条件白皮书》,作者全国汽车标准化技术委员会智能网联汽车分技术委员会

 

拓宽了车辆ODD范围,用大白话来说,就是原来只能在晴朗的白天的高速公路上开的智能网联汽车,现在在城市街道的雨天也能安全运行了,未来,还可能直接开上乡村道路,在雪天、晚上也能够安全驾驶。

 

通过拓宽车辆ODD范围,自动驾驶大模型训练方法帮助智能网联汽车更快地走出实验室,走向更多商业化、产业化应用和普及。

 

主流车企已经实现大模型技术在感知、规划和控制领域的应用,部分车企已具备全栈端到端智能驾驶能力。

在端到端大模型之前,传统自动驾驶方案的三个模块是像漏斗一样一层层分开的。

 

感知模块主要依靠各类传感器搜集周边各类环境信息,比如激光雷达、毫米波雷达、摄像头;规划模块根据感知模块搜集的信息和驾驶目的地来做路径规划与决策制定;控制模块作为整个自动驾驶系统的底层,负责实现规划模块做出的决策。

 

Apollo开放平台9.0全新架构图。

图源Apollo开发者社区

 

比如特斯拉的FSD,在诞生之初的很长时间内,一直都是采用不同的技术来实现不同模块的功能,让它们协同工作。

 

模块化设计架构的优缺点非常明显,虽然可验证、可解释、易调试,但信息容易丢失,造成误差。

 

而端到端则摒弃了模块化设计,直接一头输入一头输出,像人类驾驶员一样,看到周围环境就直接进行避障、刹车、转向等等操作。

 

端到端自动驾驶系统概念示意。

图源网络

 

端到端的优缺点同样也非常明显,输入与输出之间是黑盒,难以把控调试,需要进行大量训练来保证驾驶流畅度和安全性,但潜力巨大,上限极高。

 

今年年初,特斯拉开始在限定范围内推送FSD V12,将城市街道驾驶堆栈升级成为端到端神经网络,完成了突破的关键一步。

 

特斯拉智驾团队负责人AShok Elluswamy在X(原推特)上发文。

图源网络

 

大模型在智能座舱的应用,推动实现更自然、更智能的多模态交互,和更主动、更便捷的场景化服务。

与在感知、规划、控制等核心领域的应用相比,大模型在智能座舱的应用则没有那么多技术和安全问题要考虑,在商业化推广上更具性价比,消费者也更能感受到大模型带来的驾驶乘坐体验升级,因此在智能座舱领域,大模型的上车率极高,形式多样、种类丰富

 

广汽AI大模型平台框架。

图源广汽集团

 

大模型能够全方位综合处理汽车座舱内的各种类型数据进行多模态交互,极大提升驾乘交互体验感。比如驾驶员和乘坐者的面部表情、声音、手势、动作、体温等,转化为调节座椅、调控空调、打开相关应用等具体的指令操作,让驾驶员和乘坐者感觉既自然又智能。

 

理想AI任务大师示意图。

图源理想汽车官网

 

同时,还能够记录下驾乘场景和驾乘人员的各类数据进行复用,主动提供的个性化、场景化服务。比如家里有小孩的话,智能座舱的大模型识别到儿童会主动触发儿童看护功能,包括主动播放儿童故事、持续监测儿童的状态和行为、儿童遗留在车内发出安全警示等等

大模型的应用,为汽车人工智能带来了两种不同意义上的更新迭代,为智能网联汽车的发展增添了新的动能和可能。随着技术的不断成熟,和应用领域的不断探索,大模型将在智能网联汽车领域发挥越来越重要的作用。

本篇仅为科普分享,疏漏处恳请学者专家指正。

 

 
 
易飒科技简介

易飒科技是一家以科技赋能汽车产业人才的新旧动能转换、赋能智能网联人才终身成长和精准就业的高新技术企业,致力以产品力、服务力和人才力,打造智能网联产业生态的优质人才枢纽。旗下的产品与服务聚焦智能网联产业的“人才培养+人才匹配”两大体系,助力高速发展的智能网联产业解决人才瓶颈。